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ПЛАНИРОВАНИЕ 

МЕДИКО-БИОЛОГИЧЕСКИХ 

ЭКСПЕРИМЕНТОВ 


Наука — это в лучшем случае здравый смысл — 
строго точный в наблюдении и милосердный 

к ошибкам в логике. 
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Глава 15 ПРИСТРАСТНОСТЬ, 

РЕПРЕЗЕНТАТИВНОСТЬ 
И КОМБИНАТОРИКА ВЫБОРКИ 


Итак, предположим, что на основании вышеизло- 
женного уже сформулированы цели, определены 
методы исследования и оптимальные животные. 
Каковы же дальнейшие шаги на пути к получению 
конкретных результатов экспериментов и биологи- 
ческому моделированию? Естественным продолже- 
нием этого процесса является, конечно же, плани- 
рование экспериментов с лабораторными животны- 
ми и оценка их результатов. 

Процесс планирования экспериментов может 
быть различным по объему, поскольку зависит от 
конечной цели, которую ставит перед собой иссле- 
дователь. Испытания новых хирургических техно- 
логий представляют собой наиболее простую фор- 
му экспериментов, так как они могут проводиться 
с использованием лишь одного животного. Их про- 
тивоположностью являются многосторонние экс- 
перименты, в ходе которых исследуются тысячи 
животных, получивших составляющие апробируе- 
мой субстанции в различных дозах и при разных 
условиях. 

Использование статистики в первоначальном 
процессе планирования всех экспериментов, за ис- 
ключением простейших, имеет большое значение, 
так как позволяет не только избежать ошибок, но и 
повысить шансы успешного проведения исследова- 
ния. Ведь в конечном итоге мы осознанно или не- 
целенаправленно осуществляем это в целях биомо- 
делирования. 
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Исследователь должен четко сформулировать вопросы, на которые он 
надеется ответить в ходе эксперимента. Если для эксперимента используют- 
ся животные, важно, чтобы поставленные вопросы имели значимость, но- 
визну и прикладное значение. Недобросовестное планирование эксперимента 
может привести к расточительному использованию жизней животных, что 
является недопустимым. При планировании экспериментов с участием жи- 
вотных протокол должен составляться в письменной форме и содержать 
информацию о цели исследования, поставленных вопросах, проверяемых 
гипотезах и о предполагаемом практическом и научном значении результа- 
тов для прототипа модели, в нашем случае — человека. Важно также обес- 
печить использование возможно лучших методик и технологий. 

Высококачественные животные, хорошее оборудование и тщательный 
статистический анализ не смогут исправитъ упущения, возникшие в резуль- 
тате плохого планирования. Необходимо также минимизировать последствия 
использования участниками любого качественного исследования или про- 
екта различных методик в ходе проведения эксперимента. Все эти факторы 
должны быть изучены и включены в протокол, а в дальнейшем представле- 
ны в виде биологической модели. Другие факторы, такие, как вид и катего- 
рия животных для эксперимента, также должны быть учтены на стадии пла- 
нирования. Например, в случае, когда требуется минимизировать различия 
между животными, в протокол вносится положение об использовании ис- 
ключительно инбредных линий. Для целей других экспериментов могут, 
напротив, понадобиться гетерогенные животные. 

Для того чтобы сделать правильный выбор, исследователь должен обла- 
дать высоким уровнем знаний о различных факторах, влияющих на экспе- 
римент. Вид клеточного оборудования и такой на первый взгляд незначи- 
тельный фактор, как его размещение, должны учитываться, поскольку мо- 
жет потребоваться его разнообразить. Например, размещение всех клеток с 
тестируемой группой животных на верхних стеллажах может привести к нео- 
жиданным результатам, если степень освещения повлияет на ход экспери- 
мента. Исследования должны планироваться таким образом, чтобы исклю- 
читъ все переменные, кроме тех, которые необходимы для эксперимента. На- 
пример, количество, качество и разнообразие корма является важной пере- 
менной, которую часто недооценивают. Квалифицированный учет всех необ- 
ходимых факторов и отбор значимых параметров составляют основу планиро- 
вания экспериментов. 

Область математики, в которой изучаются вопросы о том, сколько раз- 
личных комбинаций, подчиненных тем или иным условиям, можно соста- 
вить из заданных объектов, называется комбинаторикой. Теоретическое ис- 
следование вопросов комбинаторики предприняли в XVII веке французские 
ученые Паскаль и Ферма. Дальнейшее развитие комбинаторики определило 
её место в биомоделировании. 
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Предположим, в каждую серию экспериментов нами взято по 8 живот- 
ных. Нам необходимо получить независимый, т.е. непристрастный ответ через 
каждый час эксперимента, продолжающегося в течение 4 часов, хотя бы от 
одного животного. Сколькими способами мы можем этого достигнуть? 

Рассмотрим эту задачу в общем виде. Пусть даны предметы или эивотные, 
относящиеся к п различным видам. Из них составляют всевозможные расста- 
новки по к предметов в каждой, или, как будем в дальнейшем кратко гово- 
рить, к-расстановки. При этом в расстановки могут входить и предметы одно- 
го вида, а две расстановки считаются различными, если они отличаются друг 
от друга или видом входящих в них предметов, или порядком этих предметов. 

Расстановки описанного типа называются к-размещениями с повторения- 
ми из элементов п видов, а число всех таких расстановок обозначают А к . 

Итак, мы хотим доказать, что число ^-размещений с повторениями из 
элементов п видов равно 

А к =п к . (49) 

Доказательство проводится с помощью математической индукции по к — 
числу элементов в размещении при фиксированном значении п. При к = 1 
ответ ясен — каждое размещение (с повторениями) состоит только из одно- 
го элемента, и разные размещения получаются, если брать элементы различ- 
ных видов. Но так как число видов равно я, то и число размещений равно п. 
Итак, А х п =п в соответствии с формулой (49). 

Предположим теперь, что уже доказано равенство А к ~ х - п к ~ х , и рас- 
смотрим ^-размещения с повторениями. Все такие размещения можно по- 
лучить следующим образом. Возьмем любое (к— 1) -размещение (с повторе- 
ниями) (а р а к ) и припишем к нему элемент а к одного из имеющихся 
п видов. Мы получим некоторое /с-размещение ( а р а к ] а к ). При этом 
ясно, что из каждого (к— і)-размещения получится столько ^-размещений, 
сколько есть различных видов элементов, то есть п размещений. Очевидно, 
что, действуя описанным образом, мы не пропустим ни одного Л-разме- 
щения и ни одного не получим дважды, если ( а р а к ; ) Ф ( Ь р Ъ к 7 ), 
или, если а к Ф Ь к , то ( а р а к ] а к ) Ф ( Ь ] , Ь к І Ъ к ). Поэтому число к- 
размещений с повторениями из элементов п видов в п раз больше, чем 
число (к— 1) -размещений с повторениями из элементов тех же видов. Та- 
ким образом, А к = пА п к ~ Х ■ Но мы считаем уже доказанным, что А к ~ 1 = п к ~ 1 , 
поэтому 

А к =п-п к ~ 1 =п к . (50) 

Тем самым равенство (49) доказано для всех значений к. Формула (49) 
встречается в целом ряде решений биомоделирования. Мы рассмотрим те- 
перь решение поставленной выше задачи. Восемь животных могут распреде- 
литься между четырьмя одночасовыми отрезками 4 8 способами, из них 
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в З 8 случаях — на любом одночасовом отрезке, 2 8 — на двухчасовых отрезках, 
и в одном случае на трехчасовых отрезках не будет участвовать ни одно жи- 
вотное. По принципу включений и исключений получаем ответ 4 8 — 4 х 3 8 +6 — 
— 4 = 40 824 варианта. Иными словами, всего лишь для 8 животных, взятых 
в эксперимент с четырьмя выборками, мы имеем около 41 тысячи возмож- 
ных комбинаций. А возможно ли эту задачку упростить? Да, возможно, если 
мы перейдем в иную систему счисления 

Наряду с десятичной системой счисления применяются и другие — дво- 
ичная, троичная, восьмеричная и т. д. В я-ичной системе счисления исполь- 
зуются п цифр. Подсчитаем, сколько в я-ичной системе натуральных чисел, 
записываемых ровно к знаками. Если допустить записи, начинающиеся с 
нуля, то каждое /с-значпос число в я-ичной системе счисления можно рас- 
сматривать как размещение с повторениями, составленное из к цифр, при- 
чем цифры бывают я видов. По формуле (49) получаем, что количество чи- 
сел, имеющих такую запись, равно п к . 

Но для натуральных чисел не применяют записей, начинающихся с нуля. 
Поэтому из полученного значения п к надо вычесть количество чисел, я-ич- 
ная запись которых начинается с нуля. Если отбросить у этих чисел первую 
цифру — нуль, то получим (к— 1)-значное число (быть может, также начина- 
ющееся с нуля). Таких чисел по формуле (49) будет п к ' г . 

Значит, общее количество /с-зпачпых чисел в я-ичной системе счисления 
равно: 

п к — п к ~ 1 = п к ~ 1 х (я — 1). (51) 

Например, в десятичной системе счисления имеем 10 3 х9 = 9000 че- 
тырехзначных чисел; из 10 000 чисел от 0 до 9999 надо отбросить тысячу 
чисел, а именно числа от 0 до 999. 

Полученную нами формулу можно вывести и иным способом. Ведь в 
/с-значпом числе, записанном по я-ичной системе счисления, первой циф- 
рой может быть любая из цифр 1, 2, ..., я— 1, а второй и последующими — 
любые из цифр 0, 1, 2, ..., я— 1. В эксперименте с 8 животными их комбина- 
торика распределится следующим образом: на первый час у нас я— 1 живот- 
ное, а на остальные к— 1 часов — по я кандидатов. Отсюда легко получаем, 
что искомых чисел может быть (я — 1) п кЛ . 

Рассмотрим ещё один пример. Например, необходимо получить гибриды 
Е р т. е. первое поколение животных, полученных от скрещивания двух ин- 
бредных линий. Для этих целей отобраны 5 самок и 3 самца. Необходимо 
разбить их на две группы по 4 особи, чтобы в каждой было хотя бы по од- 
ному самцу. Если в первой линии один самец, а в другой — два, то самцов 
можно разбить на группу 3 самок из 5. Это можно сделать С 3 5 = 10 спосо- 
бами. Всего по правилу произведения получаем 3 х 10 = 30 способов разбив- 
ки на группы. Это уже более реально. 
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Применение методов математической статистики к обработке наблюде- 
ний основано на глубокой аналогии между производством наблюдений и 
отбором из некоторой генеральной совокупности. При этом в качестве ге- 
неральной совокупности рассматривается чисто гипотетическая совокуп- 
ность всех возможных результатов наблюдений при данном комплексе ус- 
ловий испытания. Отбор данных из этой совокупности производится в про- 
цессе наблюдений независимо от нашей воли. Благодаря этому основным 
фактором отбора наблюдений всегда является случайность, что и позволяет 
применять для обработки наблюдений основные положения теории вероят- 
ностей. 

Отбор данных, происходящий помимо нашей воли, можно назвать есте- 
ственным отбором; именно таким является отбор данных при наблюдениях. 
Однако при производстве наблюдений и при дальнейшей их обработке часто 
возникает необходимость и в других, искусственных способах отбора. Напри- 
мер, при анализе субстанций приходится делать пробы из разных партий, 
чтобы нейтрализовать возможную неоднородность материала; отбор проб 
при этом находится целиком в нашем распоряжении. Во время контроля за 
производством лекарств приходится выбирать образцы из общей продук- 
ции. При различных клинических и демографических исследованиях также 
нужен предварительный отбор объектов для изучения. Примеры таких слу- 
чаев, когда исследователь вынужден делать сознательный выбор, можно еще 
долго продолжать. Отметим лишь, что даже заготовленный цифровой мате- 
риал может нуждаться в дополнительном отборе в целях сокращения объе- 
ма, удаления неподходящих данных, проверки правильности и добросовес- 
тности полученных данных и подготовительных расчетов. Подобный отбор 
также производится исследователем целиком по его воле. 

Существует много способов искусственного отбора; выбор того или ино- 
го способа зависит от цели отбора, от поставленной задачи. В самом общем 
плане способы отбора делятся на две группы: пристрастные и репрезента- 
тивные (см. гл. 16). 

Пристрастными называются такие способы отбора, при которых отбира- 
ются элементы по какому-либо заранее намеченному признаку, при этом 
проверке подлежат все элементы совокупности, из которой делается отбор. 
Например, из совокупности чисел отбираются п самых больших или отбира- 
ются все числа, не достигающие нужной величины. Пристрастный отбор 
применяют и для того, чтобы изъять все наблюдения с нарушенными усло- 
виями испытания. Так, при идентификации линейной принадлежности 
животных, вычислении функций обобщенного Мехаланобисова расстояния 
(см. гл. 33) морфологических параметров животных, не соответствующих 
неким заданным краниометрическим характеристикам, выделяют в отдель- 
ную группу и в дальнейшем не учитывают данные по больным и смешанно- 
породным особям. Пристрастный отбор является важной стадией экспери- 
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мента; его задача состоит обычно в том, чтобы устранить все заметные 
нарушения условий испытания. С помощью пристрастного отбора нередко 
удается ликвидировать те или иные доминирующие (несимметричные) фак- 
торы, нарушающие нормальность распределения. 

Рассмотрим простой случай пристрастного отбора, например, при иссле- 
довании действия психотропных средств у крыс по методам УРПИ или УРАИ. 
Возникает вопрос о необходимости учета важней ш их параметров, в частно- 
сти теплового колебания и взаимодействия молекул в теле животного. Хотя 
взаимодействие исследуемых веществ, несомненно, происходит на молеку- 
лярном и даже атомарном уровне, необходимость учета этого фактора ка- 
жется странной. На самом деле, какова связь условно-рефлекторных реак- 
ций с термодинамическими молекулярными процессами? 

Атомы колеблются вокруг положения равновесия с большими скоростя- 
ми, но движение это хаотическое или, скорее, псевдохаотическое. Атомы и 
частицы, движущиеся в одну сторону, уравновешиваются атомами, летящи- 
ми в другую. Но представим себе ситуацию, когда большинство атомов дви- 
жется в одну сторону, не уравновешиваясь с другой стороны. Тогда УРПИ 
и УРАИ будут извращены по непонятной экспериментатору причине. Допу- 
стимо ли это? Теоретически — да, практически — сомнительно. Как же быть 
с учетом такого фактора? Но оставим это на совести пристрастного отбора 
исследователя. 

Пристрастный отбор всегда является сознательным с ясной характерис- 
тикой данных, подлежащих отбору, поэтому он редко вызывает затруднения. 
Сложнее обстоит дело со второй группой случайных способов отбора, 
о которой речь пойдет в следующей главе. 
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Способы отбора называются репрезентативными, 
если отобранная группа элементов достаточно пол- 
но характеризует всю совокупность, из которой был 
сделан отбор. Разумеется, как бы ни был удачен 
отбор, в суждениях о всей совокупности будет эле- 
мент случайности. Более того, некоторые особен- 
ности всей совокупности вообще не отразятся на 
отобранной группе элементов, поэтому «репре- 
зентативность» отбора, вообще говоря, является 
относительной и связана с конкретной числовой 
характеристикой совокупности, которая изучается 
с помощью отобранных элементов. 

Репрезентативный отбор применяется тогда, ког- 
да судить о характеристиках совокупности, исполь- 
зуя все ее элементы, невозможно либо сли т ком 
трудно из-за того, что эта совокупность чересчур 
велика, а возможно, и не вся доступна анализу. Если 
объем N этой совокупности очень велик, то его прак- 
тически можно считать бесконечным. В этом слу- 
чае заданную совокупность можно рассматривать 
как генеральную, а отобранные элементы как вы- 
борку, применяя в дальнейшем все достижения об- 
щего выборочного метода. Если же N не очень ве- 
лико по сравнению с количеством п отобранных 
элементов (скажем, 7Ѵ < 10 п), то с числом N нужно 
считаться при интерпретации результатов отбора. 

Количество отбираемых элементов можно опре- 
делить, если известна дисперсия а 2 изучаемой ха- 
рактеристики (по каким-либо предыдущим дан- 
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ным). Это количество будет зависеть от той точности, с которой мы хотим 
получить значение характеристики. Если эта точность задана допустимой 
дисперсией 5 2 , то п определяется из формулы 


8 2^(М-пЛ 

N — 1 


(52) 




которая при очень большом N преобразуется в известную нам уже формулу 

,2 

(53) 

п 

Последнюю формулу легко объяснить: а 2 есть как бы генеральная дис- 
персия, а 5 2 есть дисперсия среднего выборки из п элементов, которая всегда 
в п раз меньше «одиночной» дисперсии. 

Допустим, что нам известна дисперсия, связанная с неоднородностью 
вещества и равная а 2 = 0,20. Допустим, что нам нужно знать содержание 
вещества с дисперсией 5 2 р не превосходящей 0,40, причем на методику ана- 
лиза приходится дисперсия 5 2 2 = 0,35 (ошибка воспроизводимости). Это зна- 
чит, что на долю неоднородности допускается оставить дисперсию л 2 < 0,05. 
Если в нашем распоряжении N = 50 проб вещества, то необходимое число 
проб п определится из равенства 

0,20 Г 50-й ^ 


0,05 = - 


50-1 


(54) 


то есть равно 5 (точное решение уравнения равно 40/9). 

Выбор того или иного способа репрезентативного отбора зависит от сте- 
пени наших знаний о всей совокупности. Если, например, нам известно, что 
элементы в совокупности расположены случайным образом, то можно при- 
менять механический отбор — отбирать каждый пятый или каждый десятый 
и так далее элемент. Если же в последовательности элементов имеется неко- 
торая ритмичность, то нужно применять аритмичный отбор, например, в 
первой десятке брать первый элемент, во второй десятке — второй и т. д. 
Скажем, анализируя один раз в день качество продукции, мы не должны 
брать пробы в одно и то же время суток. 

Иногда вся совокупность заведомо разбивается на отдельные части, ко- 
торые желательно равномерно учесть. В этом случае применяют типический 
отбор, т. е. отдельно отбирают элементы из каждой части и лишь, потом 
сводят их в общую группу. 

Так, анализируя виды или линии животных, мы должны изначально рас- 
членить их на группы сообразно требованиям, заложенным при формулиро- 
вании задач и целей эксперимента. При этом оправдана избыточность вы- 
борки каждой группы. Затем мы вправе в каждой выборке отобрать для эк- 
сперимента нужное число животных. В тех случаях, когда о всей совокупно- 
сти ничего не известно, единственной гарантией репрезентативности может 
служить случайный отбор. Для того чтобы отбор был случайным, нужно все 
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элементы совокупности пронумеровать; номера отобранных элементов дол- 
жны образовывать случайную последовательность чисел. Проверить случай- 
ность какой-нибудь последовательности чисел нетрудно хотя бы методом 
серий. Но здесь речь идет о том, чтобы создать случайную последователь- 
ность, собственной волей имитировать случай. 

Имитация случая является весьма трудной задачей. Как бы мы ни стара- 
лись, выписывая числа, делать их случайными, в них обязательно проявится 
(особенно при больших объемах) какой-то бессознательно выбранный план. 
Почти всегда можно узнать, как получена последовательность, «подделать» 
случайность трудно. Тем не менее, в очень многих исследованиях случайный 
отбор или случайное перемешивание или рандомизация данных настоятель- 
но необходимы. Как же быть в таких ситуациях? На помощь случаю может 
прийти сам случай. Например, если нужно 10 мышей для эксперимента, то 
из клетки, содержащей 50 или 100 животных, можно их отобрать. Случай- 
ность вытянутых мышек будет полностью обеспечена. Однако стоит предо- 
стеречь экспериментатора: ведь те, которых легче поймать, менее подвижны 
и могут быть больны. 

Можно воспользоваться и другим способом. Если взять, например, вось- 
мизначные таблицы логарифмов (или синусов, тангенсов и т. п.), то после- 
дние три-четыре цифры в табличных числах будут абсолютно случайными. 
Возьмем подряд нужное количество двух- , трех- или четырехзначных чисел, 
составленных из этих последних цифр, и случайность выбора нам вновь будет 
гарантирована. Для удобства пользования, получаемые, таким образом слу- 
чайные числа выписывают в виде специальных таблиц. 

Пользоваться таблицей случайных чисел очень просто. Допустим, нужно 
отобрать 10 элементов из совокупности, содержащей 100 элементов. Прону- 
меруем все элементы от 00 до 99. Затем, начиная с любого места таблиц, 
возьмем две последние цифры десяти идущих подряд чисел. Получившиеся 
номера и покажут, какие элементы надо отобрать. Так, начиная с первого 
числа, мы получим номера: 82, 49, 18, 48, 09, 50, 17, 10, 37, 51... (повторяю- 
щиеся цифры надо опустить). 

Выбранную последовательность случайных чисел в дальнейшем никоим 
образом нельзя изменять. Нужно помнить: именно случайность служит ос- 
новой применения методов математической статистики, именно она обес- 
печивает репрезентативность отбора. Нарушение случайности, как правило, 
ведет к искажению результатов. Аналогично отбору производится случайное 
перемешивание элементов. При этом нужно выписывать случайные номера 
до тех пор, пока они не охватят все заданные элементы. Это и обеспечит 
репрезентативность искомой выборки. 

Прежде чем приступить к выбору числа наблюдений или исследований, 
следует выполнить ряд процессуальных шагов. Законодательства, акты, инст- 
рукции или иные документы большинства стран мира предусматривают, что 
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каждое исследование должно проводиться в соответствии с утвержденным 
письменным протоколом, содержащим цель исследования и все методы его 
проведения. В протоколе должна быть отражена следующая информация: 

/ описательный заголовок и цель исследования; 

/ название, химическая формула и код тестируемых и контрольных суб- 
станций; 

/ наименование заказчика и исполнителя эксперимента; 

/ информация о статистических методах, которые использованы при пла- 
нировании эксперимента, и применении методов рандомизации', 

/ способ идентификации тестируемых животных ( пристрастный или типи- 
ческий отбор)', 

/ номер, вес, пол, вид, линия и возраст животного, а также источник его 
происхождения (вносятся по необходимости), а также количество живот- 
ных в эксперименте и принципы их отбора ( комбинаторика , аритмичный, 
типический или случайный отбор)', 

/ план проведения эксперимента с указанием пристрастного отбора и опи- 
санием всех методов исключения оценки хода и результатов с предубежде- 
нием (репрезентативность ); 

/ состав корма и растворителей, эмульгаторов и других материалов, исполь- 
зуемых для получения растворов и суспензий для контроля субстанций. 
Описание должно содержать сведения о допустимых уровнях загрязнения 
корма, превышение которых способно повлиять на ход эксперимента и 
исказить его результаты (метод исключения, пристрастный отбор)', 

/ дозировка тестируемой и контрольной субстанции, выраженная в милли- 
граммах на килограмм веса или иной форме, а также метод, путь и частота 
введения (в системе СИ)', 

/ вид и периодичность анализов и замеров, используемый математический 
аппарат обработки данных (статистические, дифференциальные, теория 
автоматического регулирования и другие методы)', 

/ требования к ведению письменного или иного учета и хранения информа- 
ции; 

/ дата утверждения протокола заказчиком и дата и подпись руководителя 
исследований. 

Пересмотр протокола и все, вносимые в него изменения, а также причи- 
ны, послужившие этому, должны быть документально оформлены, датиро- 
ваны, подписаны руководителем исследования и приложены к протоколу. 
Количество животных, необходимых для эксперимента, зависит от целого 
ряда факторов: целей эксперимента, степени требуемой точности, ожидае- 
мых различий последствий введения тестируемой субстанции, структуры и 
методов анализа результатов. Эти факторы также должны быть учтены в 
процессе планирования эксперимента, что требует участия в планировании 
специалиста в области статистики. 
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Глава 17 


ПРЕДЕЛ И ДОСТАТОЧНОСТЬ 
ЧИСЛА НАБЛЮДЕНИЙ 


Если для выявления результатов требуется сравнить 
две группы животных — подвергшихся воздействию 
и контрольных, то количество животных, необхо- 
димых для демонстрации действительных отличий, 
будет зависеть от предполагаемой степени этих от- 
личий. Степень отличий иногда можно предполо- 
жить исходя из результатов предыдущих экспери- 
ментов и, соответственно, определить необходимое 
количество животных. В случае если требуется боль- 
шая точность, количество животных можно увели- 
чить. Увеличение их количества целесообразно лишь 
до определенного уровня. Излишне большая выбор- 
ка влечет за собой статистическую зависимость и 
искажение результатов. 

Увеличение числа параллельных наблюдений п 
является основным способом повышения точности 
статистического анализа. Действительно, среднее 
выборки объема п имеет дисперсию в п раз меньше, 
чем одиночные наблюдения. Поэтому для опреде- 
ления необходимого числа наблюдений достаточно 
знать генеральную дисперсию наблюдений с 2 и до- 
пустимую дисперсию результата я 2 ; при этом 



( 55 ) 


Увеличивая число параллельных наблюдений, 
можно неограниченно повышать точность найден- 
ного результата, лишь бы только в процессе наблю- 
дений не менялись условия испытания. Именно этим 
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приемом пользуются, чтобы уменьшить доверительный интервал при неиз- 
менной доверительной вероятности. 

Сложнее обстоит дело с выбором числа наблюдений при проверке гипо- 
тез. Это число должно одновременно служить двум целям: уменьшать веро- 
ятность а ошибки первого рода ( отклонение правильной гипотезы) и вероят- 
ность Р ошибки второго рода ( принятие неверной гипотезы). Первая веро- 
ятность совпадает с принятым уровнем значимости р. Вторая вероятность 
зависит от многих факторов, и, в первую очередь, от того, насколько невер- 
на принимаемая гипотеза. Поэтому под |3 понимают обычно наибольшую 
возможную вероятность ошибки второго рода при любых отклонениях от 
правильной гипотезы. Контроль ошибок второго рода является трудной за- 
дачей и требует специальных методов проверки гипотезы. Общий принцип 
такого контроля мы поясним на примере конкретной гипотезы. 

Допустим, изучается нормально распределенная случайная величина ^ с 
дисперсией а 2 . Высказывается гипотеза, что генеральное среднее этой вели- 
чины а < 0 (односторонняя гипотеза). Требуется проверить эту гипотезу по 
одному наблюдению х. Если мы хотим, чтобы вероятность ошибки первого 
рода была не больше ос, мы должны считать гипотезу неверной, только если 
х > и 1а с, где и 1а — квантиль стандартного нормального распределения. 
Действительно, с доверительной вероятностью 1 — ос справедлива односто- 
ронняя оценка 

ос > х — М!_ а о, (56) 

которая позволяет утверждать, что а > 0 лишь при х > и 1а р. 

Если окажется, что х < и , а, то мы будем вынуждены рассматриваемую 
гипотезу признать справедливой, хотя, возможно, допустим при этом ошиб- 
ку второго рода. Вероятность неравенства х < и Х а р зависит от того, каким на 
самом деле является а. Если обозначить через Р(х) функцию нормального 
распределения со средним а и дисперсией а 2 , то 

Р{х < м,_ а а} = ДИ[_ а а). (57) 

Используя функцию Лапласа, получим: 


Р{х<и ] _ а о} = -+Ф 


и 1-а°~ а 


= -+Ф 
2 


а 




(58) 


Если а > 0, то принимаемая гипотеза неверна. Однако при этом ос может 
быть сколько угодно близким к нулю, а это значит, что 


Ф 


а 

и \-а° 


будет сколько угодно близко к 


(59) 


ф («!-«)=" “ 


( 60 ) 


Глава 17. Предел и достаточность числа наблюдений 
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Иными словами, максимальная вероятность ошибки второго рода равна 

Р = ^ + Ф(и/-<х) = 1- а • (61) 

Например, при обычном уровне значимости а = 0,05 будет |3 = 0,95, т. е. 
мы почти всегда ошибемся и примем неверную гипотезу. 

Итак, желая застраховать себя от несправедливого отклонения верной 
гипотезы, мы впадаем в другую крайность, объявляя правильными почти 
сплошь неверные гипотезы. Точно такая же картина возникнет, если в каче- 
стве отправной точки взять фиксированную малую вероятность |3. Для того 
чтобы вероятность принять неверную гипотезу не превышала [), мы должны 
будем отклонять гипотезу уже при х > —и х _ рСТ. А это значит, что большой 
станет вероятность ос, по-прежнему равная 1 — |3. Соотношение вероятнос- 
тей а и Р выражается площадями участков под нормальной кривой. Пло- 
щадь, расположенная справа от критического значения, равна ос, располо- 
женная слева — равна [). Стараясь уменьшить ос, мы сдвигаем это критичес- 
кое значение вправо, стараясь уменьшить [) — влево. Ясно, что с помощью 
единого критического значения невозможно даже сделать так, чтобы обе эти 
вероятности были меньше 1/2. На практике обычно вероятности ошибок 
обоих родов задаются заранее и являются малыми числами (не больше 0,1). 
В этом случае при проверке гипотезы приходится пользоваться одновременно 
двумя критическими значениями: считать гипотезу верной, если х< —и х _рО, 
и неверной, если х > и 1а о. Такой подход обеспечивает заданный уровень ве- 
роятностей ошибок первого и второго рода, однако при этом появляется 
участок неопределенности [— и х _^о, Длина этого участка 

5 = («і_р + «і_ а ) о (62) 

называется неопределенностью критерия. Вопрос о том, какой вывод делать в 
случае, если х попадет на участок неопределенности, решается примени- 
тельно к условиям задачи; чаще всего в этом случае гипотеза объявляется 
сомнительной и подвергается повторному анализу. 

Неопределенность критерия сильно ухудшает эффект статистического ана- 
лиза гипотез, поэтому ее всячески пытаются, если не устранить вообще (мы 
уже видели, что это невозможно), то, по крайней мере, сделать как можно 
меньше. Непосредственно из формулы (62) видно, что это можно сделать и 
при неизменённых заданных ос и (3, если уменьшать дисперсию о 2 . Уменьшать 
дисперсию можно, повышая точность методики. Но более универсальным и 
надежным средством является увеличение числа параллельных наблюдений. 

Действительно, если вместо одиночного провести п параллельных на- 
блюдений и рассмотреть их среднее х, то его дисперсия будет 

2 а 2 
о— = — 

X 


п 
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Проверяя гипотезу по значению х, мы должны будем принять ее, если 


х < _м і-р —і = , и отвергнуть, если * > _м і-р ~т = . 

у]П \ П 

Неопределенность станет теперь равной 

5 = (мі_ р +щ_ а )-2= * ( 63 ) 

т. е. уменьшится в Ѵи раз. 

В практических задачах допустимая неопределенность критерия задается 
обычно заранее, наряду с вероятностями а и |3. Это позволяет сразу же оп- 
ределить необходимое число параллельных наблюдений: 


п = (и 1 _ ? +щ_ а У 




(64) 


Как бы тщательно мы не изучали и использовали математические, и в 
частности, статистические методы, мы не должны упускать конечную цель - 
биологическое моделирование процесса, функции, эффекта в плане строго- 
го переноса вновь полученных данных на прототип, т.е. на человека. 

Обратимся в этом ключе к случаям планирования фармако-токсиколо- 
гических экспериментов. Прежде чем осуществить конкретные исследова- 
ния, необходимо осуществить доэкспериментальные мероприятия — от это- 
го зависит корректность полученных результатов. Необходимо весьма строго 
подойти к выбору конкретных биологических моделей, их соответствию для 
исследования совершенно определенных субстанций, веществ или препара- 
тов. Без такого подхода, выбранная биомодель может не только не соответ- 
ствовать прототипу, но и заведомо извращать результаты экстраполяции. 

Это особенно важно в случае использования биомоделей второго поряд- 
ка т. е. при альтернативном моделировании. Удачный логический анализ 
в этом направлении осуществлен Г.Н. Красовским [386]. Во избежание оши- 
бок при оценке генотоксичности и канцерогенности объектов окружающей 
среды, последствия которых для человека становятся негативными, должны 
быть представлены данные с показателями суммарной мутагенной активно- 
сти. Следует учитывать, что существенный вклад в токсичность исследуемых 
субстанций могут вносить не сами исследуемые вещества, а содержащиеся 
в них примеси. 

Очевидно, что в таких случаях прямая экстраполяция данных с биотестов 
на человека некорректна. Использование альтернативных моделей в токси- 
кологических оценках должно основываться на параметрах стандартных уров- 
ней реагирования модельных объектов на индивидуальные вещества и со- 
держащиеся в них примеси. Только в этом случае можно говорить о допус- 
тимости прямой экстраполяции полученных при биотестировании результа- 
тов на прототип. Рассмотрим этот подход в рамках вышеизложенных мате- 
матических дефиниций. 
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Проанализируем ситуацию, когда в исследуемом на токсичность веще- 
стве присутствуют вредные примеси. К сожалению, мы сталкиваемся с 
такой ситуацией в большинстве случаев, поскольку 100%-ный уровень очи- 
стки невозможен, будь то продукты химического синтеза, генно-инже- 
нерные или рекомбинантные конструкции, вещества природного проис- 
хождения. 

В Институте новых технологий РАМН нами был разработан принципи- 
ально иной подход к созданию 0,1%-ного нитроглицерина для инъекций. 
Субстанцию мы получали от крупного оборонного предприятия. Хотя все 
требования фармстатьи были соблюдены и выходной контроль подтверждал 
это, нас не удовлетворял желтоватый цвет (откуда ему было появиться?) 
субстанции и иные нюансы, которые здесь мы обсуждать не будем. 

Поскольку мы создавали принципиально новую технологию получения 
нитроглицерина в глюкозе (в дальнейшем — в лактозе, галактозе и т.д.), а не 
на спиртовой основе, мы провели тщательный анализ всей технологической 
цепочки и поняли, что в процессе стерилизации автоклавированием, по- 
видимому, происходит окисление глюкозы, дающее примеси. Потребовались 
многие месяцы для перехода на фильтрационную стерилизацию, на новый 
техрегламент, согласование его с технологами, на новые доклинические и 
клинические испытания, согласование и утверждение в Минздраве, патен- 
тование [696]. Но этот труд стоил результата. В конечном итоге, нам удалось 
получить не «желтоватый», а свободный от примесей, т.е. более безопасный 
для человека, с меньшими побочными проявлениями чистый препарат, ут- 
вержденный в качестве новой ФСП в Российской Федерации. 

На основе этого примера из нашей научно-производственной практики 
попытаемся формализовать этот процесс и представить его в более общем 
виде. 

Зададим условие, при котором содержание побочного продукта не долж- 
но превышать 0,04%. Ошибка воспроизводимости одиночного анализа 
а = 0,002%. Требуется, чтобы вероятность наличия вредных примесей не 
превышала Р = 0,02. Вместе с тем мы не должны исключать из эксперимента 
вещества, входящие в выборку с примесями до 0,04%. Если содержание при- 
меси в субстанции «на пределе», какие-либо гарантии дать трудно. Но мы 
можем, например, потребовать, чтобы вероятность исключения веществ с 
содержанием примеси ниже 0,036% (считаем их соответствующими на ш им 
требованиям) не превышала ос = 0,05. Нужно определить число параллель- 
ных анализов, которое позволило бы удовлетворить всем поставленным тре- 
бованиям. 

Чтобы использовать проведенные ранее теоретические рассуждения, бу- 
дем в качестве случайной величины с, рассматривать отклонение результата 
анализа примеси от заданного предела 0,04. Генеральное среднее ос величи- 
ны с, даст истинное значение этого отклонения. Предположение «субстан- 
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ция пригодна» совпадает с гипотезой а < 0. Вероятности а и (3 заданы в 
явном виде, допустимую неопределенность критерия легко найти: 


5 = 0,04 - 0,036 = 0,004. 


Отсюда 


П ~( и 0,95 + М 0,988 ) 






= ( 1,64 + 2 , 05 )" 


0,002 

0,004 


Л2 


= 3,42 


(65) 


т. е. для выполнения всех требований задачи нужно делать четыре парал- 
лельных анализа. Субстанция будет при этом признана безоговорочно год- 
ной, если среднее отклонение 


х<-2, 05^—0, 002 , ( 66 ) 

т. е. если по результатам четырех анализов содержание примеси (в среднем) 
окажется меньше 0,038%. 

Если результат анализа будет больше чем 0,038%, то субстанция является 
или сомнительной (в пределах участка неопределенности), или неприемле- 
мой. Обычно участок неопределенности присоединяют к участку неприем- 
лемой субстанции, считая вещество непригодным всегда, как только резуль- 
тат анализа окажется больше 0,038%. Это связано с тем, что в процессе син- 
теза и очистки субстанции никогда не работают на пределе значений приме- 
сей. Вероятность получения готовой субстанции с содержанием примеси, 
близким к 0,04%, достаточно мала. 

Описанная схема анализа предполагает, что число параллельных наблю- 
дений п выбирается до токсикологического эксперимента и в процессе ис- 
следования не меняется. Однако, если бы первый же анализ примесей суб- 
станции был < 0,02%, то токсикологические исследования можно было бы 
осуществлять как с совершенно «чистым» веществом. Иными словами, выб- 
ранное заранее п всегда достаточно для получения заданных вероятностей а 
и [3, но отнюдь не всегда необходимо. 

Излишних наблюдений можно избежать, поступая, например, следую- 
щим образом. Вначале делают одно наблюдение х 1 и сравнивают его с пре- 
делами [и^рСТ и «[„„.а]. Если это наблюдение будет меньше [и^а], тогда 
гипотезу а < 0 можно сразу же принимать; если х { > и 1а а, то гипотезу мож- 
но сразу отвергнуть. И только если х І попадает на участок неопределенности 
[ м і_р°, и 1а р], нужно проводить второе наблюдение. 

Сделав второе наблюдение х 2 , находим среднее: 


*2 


X, +х 2 

2 


(67) 


а 


45 ѴІ 


о 


- а 4~2 


Это среднее сравниваем с пределами 


и Щ 
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Гипотеза может быть снова отвергнута или принята, и тогда наблюдения 
кончаются. Если же х 2 попадает на новый участок неопределенности 


и і-р 7=> м 1 


о а 

Л ,и '- а ^ 


то делают третье наблюдение х,, находят среднее 


X, + Х-> + X, 


X, =- 


(68) 


и начинают новую проверку по пределам 


“ 1_Р л/3 и Мі -“Ѵз • 

Процесс продолжается до тех пор, пока количество наблюдений не дос- 
тигнет выбранного заранее по формуле числа п. 

Ясно, что при таком способе проверки гипотезы число необходимых 
наблюдений будет в большинстве случаев значительно меньше первоначаль- 
но выбранного п. 

Разумеется, последовательное увеличение числа наблюдений неприемле- 
мо там, где наблюдения проводятся заранее намеченными сериями и добав- 
ление новых наблюдений сопряжено с большими трудностями. Например, 
при исследовании в гистохимии или электронной микроскопии необходи- 
мое число снимков нужно определять заранее. В противном случае для каж- 
дого нового снимка или соседнего участка придется повторять весь процесс. 

До сих пор во всех наших рассуждениях проверялась гипотеза а < 0. Ги- 
потеза а > 0 проверяется аналогично, только теперь ее нужно принимать, 
если 


X 

* > М '” р 7й (69) 

Обе эти гипотезы односторонние и проверяются с помощью односто- 
ронних критериев. 

Если же проверяется двусторонняя гипотеза а = 0 (ни больше, ни мень- 
ше), то для проверки нужно применить двусторонний критерий. Пусть, по- 
прежнему, вероятность отклонить верную гипотезу равна а, а вероятность 
принять гипотезу, в то время как на самом деле ос > 5, равна |3. 

Тогда число наблюдений определится формулой 


п = 


и „ +и 


а " гм 1-р 


/ „ Л 




(70) 


и гипотеза признается справедливой только, если среднее х одновременно 
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удовлетворяет двум неравенствам: 



(71) 


Мы рассмотрели вопрос о выборе числа параллельных наблюдений, ког- 
да дисперсия наблюдений с 2 известна заранее. Если же а 2 заранее неизвест- 
на, то для оценок нужно применять критерий Стьюдента. Выбор числа на- 
блюдений п при этом более сложен и изложен в специальной литературе по 
математической статистике. 

Важным открытием биологии конца XX века была разгадка генетическо- 
го кода. Удалось выяснить, каким образом наследственная информация 
передается потомству. Поскольку информация записана в гигантских моле- 
кулах дезоксирибонуклеиновой кислоты (ДНК), то существенно, как раз- 
личные молекулы ДНК отличаются друг от друга, в каком порядке идут в 
них 4 азотистых основания: аденин, тимин, гуанин и цитозин. Эти осно- 
вания определяют порядок построения белков организма из двух десятков 
аминокислот, причем каждая аминокислота зашифрована кодом лишь из 
трех азотистых оснований, а не четырех. 

Но откуда взялось число 3? Почему не 2 или 4? Ведь с помощью комби- 
наций двух оснований можно зашифровать лишь 4 2 = 16 аминокислот, а 
этого недостаточно. Если же брать по 3 основания, то получим 4 3 = 64 ком- 
бинации. А этого с избытком хватит, чтобы зашифровать два десятка. Было 
бы весьма интересно узнать, как используется в природе избыточность ин- 
формации — ведь число комбинаций равно 64, а число аминокислот втрое 
меньше. Природа предусматривает достаточность резервирования, но отнюдь 
не избыточность — она рачительная, но и экономная хозяйка. 

Так, в одной хромосоме содержится несколько десятков миллионов азо- 
тистых оснований. Число различных комбинаций, в которых они могут 
идти друг за другом, невообразимо велико. Ничтожной доли этих комби- 
наций достаточно, чтобы обеспечить все разнообразие живой природы за 
время существования жизни на Земле. Разумеется, надо иметь в виду, что 
лишь ничтожная доля теоретически возможных комбинаций приводит к 
жизнеспособным организмам. Оно равно 4 м , где N — число оснований в 
хромосоме. 

При решении многих комбинаторных задач целесообразно воспользовать- 
ся методом сведения к аналогичной задаче для меньшего числа предметов, 
или методом рекуррентных соотношений (от латинского гесиггеге — возвра- 
щаться), который позволяет свести задачу об п предметах к задаче об п — 1 
предметах, потом к задаче об п — 2 предметах и т. д. Последовательно умень- 
шая число предметов, доходим до задачи, которую уже легко решить. Во многих 
случаях удается получить из рекуррентного соотношения явную формулу для 
решения комбинаторной задачи. 
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В 1202 году итальянский математик Фибоначчи среди многих других задач 
привел следующую: пара кроликов приносит раз в месяц приплод из двух 
крольчат (самки и самца), причем новорожденные крольчата через два ме- 
сяца после рождения тоже приносят приплод. Сколько кроликов появится 
через год, если в начале года была одна пара кроликов? 

Из условия задачи следует, что через месяц будет две пары кроликов. 
Через два месяца приплод даст только первая пара кроликов, и получится 3 
пары, а еще через месяц приплод дадут и исходная пара кроликов, и пара 
кроликов, появившаяся два месяца тому назад. Поэтому всего будет 5 пар 
кроликов. 

Обозначим через Р{п) количество пар кроликов по истечении п месяцев 
с начала года. Мы видим, что через и + 1 месяцев будут эти Р(п) пар и еще 
столько новорожденных пар кроликов, сколько было в конце месяца п — 1, 
то есть еще Р(п — 1) пар кроликов. Иными словами, имеет место рекуррент- 
ное соотношение 


Р(п + 1) = Р{п) + Р(п - 1) (72) 

Так как по условию, ДО) = 4 и Д1) = 2, то последовательно находим 
Р( 2) = 3, Р (3) = 5, Р( 4) = 8, и т.д.,в частности Р( 12) = 377. 

Числа Р(п) называют числами Фибоначчи. Они обладают целым рядом 
свойств. Выведем выражение этих чисел через С к т . Для этого установим связь 
между числами Фибоначчи и следующей комбинаторной задачей. Найти 
число «-последовательностей, состоящих из нулей и единиц, в которых 
никакие две единицы не идут подряд. 

Чтобы установить эту связь, возьмем любую такую последовательность и 
сопоставим ей пару кроликов по следующему правилу: единицам соответ- 
ствуют месяцы появления на свет одной из пар «предков» данной пары (вклю- 
чая и исходную), а нулями — все остальные месяцы. Например, последова- 
тельность 010010100010 устанавливает такую «генеалогию» — сама пара по- 
явилась в конце 11-го месяца, ее родители — в конце 7-го месяца, «дед» — 
в конце 5-го месяца и «прадед» — в конце второго месяца. Исходная пара 
кроликов зашифровывается при этом последовательностью 000000000000. 

Ясно, что при этом ни в одной последовательности не могут стоять две 
единицы подряд — только что появившаяся пара не может, по условию, 
принести приплод через месяц. Кроме того, при указанном правиле различ- 
ным последовательностям отвечают различные пары кроликов, и обратно, 
две различные пары кроликов всегда имеют разную «генеалогию», так как, 
по условию, крольчиха дает приплод, состоящий только из одной пары 
кроликов. 

Установленная связь показывает, что число «-последовательностей, об- 
ладающих указанным свойством, равно Р(п). 
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Докажем теперь, что 

т = <Л + , + с\ + сѵ, + ...+ СУ„_„ + , , (73) 

где р = (п + 1)/2, если п нечетно, и р = д/2 если я четно. 

Иными словами, р — целая часть числа (я + 1)/2 (в дальнейшем мы будем 
обозначать целую часть числа а через Е(а)), таким образом, 

р = Е(п + 1)/2. (74) 

В самом деле, Е(п) — это число всех я -последовательностей из 0 и 1, в 
которых никакие две единицы не стоят рядом. Число же таких последова- 
тельностей, в которые входит ровно к единиц и я — к нулей, равно С к п к+Ѵ 
Так как при этом должно выполняться неравенство к < я — к + 1 , то /с изме- 
няется от 0 до Е(п+ 1 )/2. Применяя правило суммы, мы вновь приходим к 
соотношению (74). 

Таким образом, правильное использование статистических приемов и 
математических методов в планировании эксперимента, анализе результатов 
и формулировании результатов научных исследований имеет наиважнейшее 
значение. Статистика является базовым приемом для определения соотноше- 
ния единичного экспериментального образца и определенной популяции. 
Она является инструментом, позволяющим исследователю определить, ка- 
кое количество изменений следует отнести на долю случая, а какое вызвано 
определенным воздействием в целях эксперимента. Надлежащее использо- 
вание статистических методов позволяет определить количество животных, 
необходимых для эксперимента, способствуя, таким образом, их экономии. 
В нашем случае статистические приемы позволяют спланировать, выпол- 
нить исследования, построить модель и осуществить корректный экстрапо- 
ляционный перенос новых данных на прототип, т. е. на человека 
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Глава 18 АНАЛИЗ И ИНТЕРПРЕТАЦИЯ 

РЕЗУЛЬТАТОВ: РАЗДЕЛЯЙ 
И ДЕЙСТВУЙ 


Интерпретация результатов для некоторых экспе- 
риментов может заключаться в описании, а для 
других в аналитическом сравнении различных ви- 
дов полученного лечения или воздействия субстан- 
ции в двух или нескольких различных группах. Как 
вы ш е отмечалось, эксперименты можно разделить 
на два вида: подтверждающие и исследующие. В под- 
тверждающих экспериментах делается попытка от- 
ветить на заранее поставленные вопросы. В иссле- 
дующих экспериментах описывается исходное состо- 
яние и формулируются гипотезы для дальнейшей 
проверки и построения модели. 

Для подтверждающих экспериментов использу- 
ются различные статистические тесты. Эти тесты 
основаны на гипотезе нулевого эффекта, то есть 
предполагается, что оказанное воздействие не дало 
никакого эффекта. Также предполагается естествен- 
ное отличие тестовой и контрольной групп, но если 
было найдено отличие, которое нельзя считать ес- 
тественным или случайным, считается, что их выз- 
вало причиненное воздействие. 

В исследующих экспериментах также использу- 
ется статистика, но не в целях определения значи- 
мых отличий последствий воздействия. Статисти- 
ческие приемы в этих экспериментах скорее исполь- 
зуются для математической оценки, описания ре- 
зультата воздействия на определенную популяцию 
или математического моделирования. 
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Последовательный анализ 


В предыдущей главе приводились соображения, показывающие, что число 
наблюдений можно сократить, если по ходу анализа учитывать уже сделан- 
ные наблюдения. Обобщением этой идеи служит разработанный Вальдом 
метод последовательного анализа. При этом методе после каждого нового 
наблюдения решают, принять гипотезу, отклонить или продолжать испыта- 
ния. Последовательный анализ позволяет сокращать число необходимых 
наблюдений в среднем в два-три раза по сравнению с обычными методами, 
фиксирующими число наблюдений заранее. 

Сейчас последовательный анализ — это уже обширная теория. Мы рас- 
смотрим его только в применении к анализу генерального среднего а на- 
блюдаемой случайной величины. 

Допустим, что нам нужно сделать выбор между гипотезами а < и а > ос 2 
(предполагается, что а, < а 2 ). Вероятность принять гипотезу а > оц, когда в 
действительности а < а р обозначим через а. Вероятность противоположной 
ошибки, т. е. принятия гипотезы ос < ос р когда в действительности ос > а 2 , 
обозначим через [З.Числа а и (3 обычно малы и задаются заранее. 

Основная идея последовательного анализа заключается в следующем. 
При каждой совокупности наблюдений х ѵ х 2 , х п мы можем найти веро- 
ятность р п ' того, что эти наблюдения получены из совокупности с генераль- 
ным средним ос/, и вероятность р п " того, что они получены из совокупности 
с генеральным средним а 2 . Согласно принципу максимума правдоподобия 
на практике осуществляются события с максимальной вероятностью. Это 
значит, что при р п ' > р" нужно считать более правдоподобным значение 
ос = ос } (а с ним и всю гипотезу а < ос/. Если же р " > р п ', то предпочтение 
нужно отдать второй гипотезе ос > ос,. Итак, все решается отношением прав- 
доподобия р"/р п '. 

Существенно важно, будет ли оно больше или меньше единицы. Ясно, 
однако, что в случае, когда отношение правдоподобия лишь немного отли- 
чается от единицы, предпочтение соответствующей гипотезе будет весьма 
сомнительным, и лучше всего продолжить испытания. Точные показатели, 
насколько должно отношение правдоподобия отличаться от единицы, чтобы 
между гипотезами можно было сделать уверенный выбор, определяются за- 
данными вероятностями ос и [3. Вальд показал, что гипотезу ос < ос, можно 
принять, если 


Рп, Р 
Рп 1 -« ’ 

и гипотезу а > а 2 можно принять, если 

Рп > 

Рп а 


( 75 ) 


(76) 
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Если же 


Р ,Р’« ; 1~Р 

1 - а р' п а 


(77) 


то испытания надо продолжать. 

При каждом новом наблюдении границы для отношения правдоподобия 
не меняются, меняется лишь само отношение. Это облегчает применение 
последовательного анализа, позволяет свести его к простым алгоритмам. 

Если наблюдаемая случайная величина имеет нормальное распределение 
с заранее известной дисперсией а 2 , то условие продолжения испытаний мож- 
но преобразовать к виду 

А 1 + Ъп < < А 7 + Ъп, (78) 

где 


А\ =2,3- 


-ч- 


Р 


= 2,3 


о , !-Р ь 
Ч — ,ь-- 

о^-а, а 


а! + а 2 


(79) 


а 2 -а, 1-а 

Числа А { , А 2 и Ъ подсчитываются сразу же по исходным данным, благо- 
даря чему дальнейшая проверка ведется только по сумме проделанных на- 
блюдений и их числу. 

Последовательный анализ нормально распределенной случайной вели- 
чины особенно удобно проводить геометрически. Для этого после каждого 
наблюдения строят точку на координатной плоскости, откладывая по оси 
абсцисс число проделанных наблюдений п, а по оси ординат их сумму Хд,-. 
Испытания нужно продолжать, пока эти точки будут находиться в полосе 
между прямыми у = А 1 + Ъп и у = А 2 + Ъп (рис. 3). Если же хоть одна точка 
окажется ниже этой полосы, анализ нужно прекращать и принимать гипо- 
тезу а < а,. Точно так же гипотеза а > ос 2 принимается, как только хоть одна 
точка окажется выше указанной полосы. 

Рассмотрим следующий пример. Необходимо построить эксперимент по 
отбору животных (в нашей лаборатории это осуществляется на крысах \УіМаг) 
с целью получения гибридов первого поколения, устойчивых к гипоксии. 
Зададим условие, что число слабо устойчивых к гипоксии не должно превы- 
шать 60%. В связи с естественной дисперсией и генетической неоднородно- 
стью групп животных возникает средняя квадратичная ошибка результатов, 
известная по большому числу предыдущих анализов и равная а = 0,24%. 
Чтобы гарантировать добротность, требуется отбраковать животных, имею- 
щих низкую устойчивость к гипоксии и попадающих в выборку, превышаю- 
щую 60%, с вероятностью не меньшей 0,95. В то же время нельзя отбрако- 
вывать животных, составляющих выборку, превышающую 40%. Поэтому 
ставится еще одно требование — животные, попадающие в выборку не более 
чем на 58%, принимать с вероятностью 0,90. 

Покажем, как для контроля устойчивых к гипоксии животных приме- 
нять последовательный анализ. В поставленных условиях а, = 58, |3 2 = 60. 
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Допустимые вероятности ошибок: а = 1 — 0,90 = 0,10и(3 = 1 — 0,95 = 0,05. 
Непосредственно вычисляем 


А = 2,3 


0,24^ ,0,05 
0,20 18 0,90 


- = -8,31, 


(80) 


„ 0,24^ 0,05 ,, 1П 

А 2 =2,3 1§ = 13,10 , 

2 0,20 0,10 


(81) 


5,8 + 6,0 
2 


= 5,9 . 


Область продолжения анализов будет ограничена прямыми 


(82) 


у = —8,31 + 5,9 п ѵ 

которые построены на рис. 3. Анализ 
тат 42%. Пусть ему соответствует на 
ординатой у = 4,2. Результаты иссле- 
дований данной выборки (обозначим 
её точкой М { ) находится в статисти- 
ческой области «продолжения испы- 
таний», поэтому берем вторую вы- 
борку. Её анализ дал результат 39%, 
что соответствует условной точке М 2 
с абсциссой п = 2 и ординатой у = 
4,2+ 3,9 = 8,1. Испытания снова 
нужно продолжать. Третий анализ 
дал значение 36%; ему соответствует 
некая точка М ъ с абсциссой п = 3 и 
ординатой у = 8,1 + 3,6 = 1 1,7. Чет- 
вертому анализу с результатом 40% 
соответствовала бы точка М 4 ( п = 4, 
у = 15,7). Наконец, пятая точка М- , 
соответствующая еще одному анали- 
зу с результатом 44%, получает коор- 
динаты п = 5, у = 15,7 + 4,4 = 20,1, 
и выходит за пределы «полосы М 4 
продолжения испытаний» в ожидае- 
мом нами направлении. Данную вы- 
борку животных можно считать со- 
ответствующей требованиям устой- 
чивости к гипоксии (рис. 4). 

Может показаться, что устойчи- 
вость к гипоксии видна уже из пер- 


[>>=13,10 + 5,9/1, (83) 

первой выборки животных дал резуль- 
рис. 4 точка М ] с абсциссой л = Іи 



Рис. 3. Координатная плоскость и оси, опреде- 
ляющие проведенные эксперименты, иллюс- 
трирующие, что в этих исследованиях нет жи- 
вотных, устойчивых к гипоксии 



Рис. 4. Точка М 5 выходит за пределы необхо- 
димости продолжения испытаний, иллюстри- 
рующие наличие животных, устойчивых к ги- 
поксии 


Глава 18. Анализ и интерпретация результатов: разделяй и действуй 
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вого анализа. К сожалению, такой вывод поспешен, так как из-за высокого 
значения о мы не можем гарантировать заданные вероятности ошибок ос и (3. 

Для решения поставленной задачи с помощью метода последовательного 
анализа нам понадобилось пять наблюдений. Если же мы захотим опреде- 
лить число наблюдений п заранее по формулам предыдущего пункта, то мы 
получим: 


И_ ( М 0,90 +м 0,95) 


а 


ѵ а 2 -а, ) 


( 1,28 + 1 , 65 )" 


0,24 

0,20 


= 13 


( 84 ) 


т. е. классический метод потребовал бы 13 серий экспериментов. В то время 
как при планировании и использовании математического аппарата Вальда, 
т.е. последовательного анализа мы получаем репрезентативную выборку и 
корректный результат уже при пяти сериях. Преимущества планирования и 
оптимизации эксперимента и последовательного анализа неоспоримы. 


Принятие решений 

Как бы тщательно не был осуществлен анализ и дана интерпретация резуль- 
татов экспериментов, перед исследователем стоит задача принятия решения. 
Под понятием «принятие решения» подразумевается применение математи- 
ческих и количественных методов для обоснования решений. Оно включает 
в себя: постановку задачи; построение математической модели; нахождение 
метода решения; проверку и корректировку модели; реализацию найденно- 
го решения в виде нахождения экстраполяционных параметров переноса с 
биомодели на прототип (человека или животного). 

Построение математической модели осуществляется на основе достаточ- 
но строгой, логически непротиворечивой, содержательной постановки зада- 
чи. Этот процесс называется формализацией задачи. 

В том случае, когда все действующие в эксперименте факторы определены 
и достоверны, а случайные воздействия отсутствуют, мы сталкиваемся с ситу- 
ацией принятия решений в условиях определённости. Например, необходимо 
испытать активность нового жаропонижающего средства при эксперименталь- 
ной гиперэргии. Результат исследования даст абсолютно однозначный ответ о 
наличии эффекта. Более того, исследователь получит однозначные количе- 
ственные показатели этого действия, выраженные в градусах Цельсия. Есте- 
ственно, что решение о результатах отвечает условиям определенности. 

Если же мы находимся в ситуации, в которой результаты экспериментов 
не дают однозначного ответа, а относятся к одному из множества возмож- 
ных откликов с разными вероятностями их осуществления, а исход конкрет- 
ной реализации случаен и непредсказуем, метод называют принятием реше- 
ний в условиях риска. Например, эксперимент в полном развитии, а под ок- 
ном рабочие затеяли рубить асфальт. 
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В тех случаях, когда результаты экспериментов зависят от непредсказуе- 
мых факторов, такая задача, называется принятием решений в условиях не- 
определённости. Например, требуется выдать заключение о радиопротектор- 
ном действии препарата в условиях комплексного воздействия радиацион- 
ных, акустических и электромагнитных факторов. Чтобы исключить явле- 
ния неопределенности, необходимо исследовать протекторные свойства каж- 
дого из факторов, их попарного воздействия и комплексного влияния. Это 
требует огромного количества экспериментов и достаточно сложного мате- 
матического анализа. Экспериментатор вправе, без дополнительных иссле- 
дований, принятъ решение в условиях неопределенности. Иными словами, 
если нет полной информации, то остаётся либо предполагать, либо строить 
догадки. Поэтому в формулировке таких задач следует делать оговорку «по 
возможности», «по-видимому», «вероятно». 

В процессе принятия решений можно выделить несколько этапов: 

/ определить основные и альтернативные способы действия, адекватный 
набор целей и установить нормы и пределы искомых результатов; 

/ условия неопределённое™, связанные с альтернативными решениями, 
должны быть выражены через распределение вероятностей, желательно чис- 
ленно; 

У искомые результаты должны быть представлены через ранжирование 
предпочтений в числовой форме; 

/ рациональный синтез информации должен быть осуществлен таким 
образом, чтобы можно было построить общую модель принятия решений. 

Многие исследователи и специалисты в области исследования операций 
и теорий принятия решений руководствуются принципом «разделяй и дей- 
ствуй», иными словами, необходимо любую анализируемую ситуацию разде- 
лить на части, а затем действовать в соответствии с указанными этапами, т.е. 
каждую часть анализировать отдельно. Только после этого можно построить 
общую модель для принятия решений. 

Некоторые, не лишенные чувства юмора специалисты определяют про- 
цессы принятия решений и исследования операций, как искусство давать 
плохие ответы на те научные вопросы, которые при других подходах являют- 
ся ещё худшими. Но если говорить серьезно, то решение, принятое в усло- 
виях неопределённое™, но на основании математических расчётов, будет 
лучше, чем взятое наугад первое попавшееся или, которое некоторые иссле- 
дователи не без юмора называют эвристическим или интуитивным. 



